Вероятность правильного оформления счета на предприятии составляет 0,95. Во время аудиторской проверки были взяты два счета. Какова вероятность того, что только один из них оформлен правильно?
A) 0,095
B) 0,126
C) 0,95
D) 1,34
ANSWER: A
В поликлинике ведут прием три врача, причем первый врач принимает 500/0 , второй 200/0 , третий 300/0  всех больных. Одному из пациентов поставили ошибочный диагноз.  Найти вероятность  того, что второй врач поставил ошибочный диагноз. Вероятность врачебной ошибки у врачей составляет 10/0, 80/0, 30/0  соответственно.
A) \( \frac{8}{15} \)
B) \( \frac{3}{10} \)
C) \( \frac{1}{35} \)
D) 0,12
ANSWER: A
Дискретная случайная величина задана в виде ряда распределения:X		   1		     3		    5     7		      9		P		  0.1 		   0.15  		   0.6  		   0.1  		   0.05  Найти ее математическое ожидание.
A) 4,7
B) 5,1
C) 0,25
D) 6,2
ANSWER: A
Из 18 стрелков 5 попадают в мишень с вероятностью 0,8; 7 – с вероятностью 0,7; 4 – с вероятностью 0,6; 2 – с вероятностью 0,5. Наудачу выбранный стрелок произвел выстрел, но в мишень не попал. Какова вероятность того, что это был стрелок из второй группы?
A) \( \frac{7}{19} \)
B) \( \frac{7}{18} \)
C) \( \frac{4}{17} \)
D) 0,54
ANSWER: A
Из колоды из 52 карты берут наугад 2 карты. Найти вероятность того, что это будут карты одной масти.
A) \( \frac{12}{51} \)
B) \( \frac{2}{52} \)
C) \( \frac{1}{51} \)
D) \( \frac{6}{35} \)
ANSWER: A
Испытывают два независимо работающих элемента. Длительность времени безотказной работы\( F_1(t)=1-e^{-0,02t}, \ \ F_2(t)=1-e^{-0,05t} \)Найти вероятность того, что за 6 часов оба элемента откажут. 
A) 0,03
B) 0,02
C) 0,56
D) 0,4
ANSWER: A
Как выглядит выход $h(x)$ модели линейной регрессии?
A) \( h(x)=\theta_0+\theta_1 x \)
B) \(h(x)=sigmoid(\theta_0+\theta_1 x) \)
C) \(h(x)=\left\{\begin{array{c}-1, x <0, //1, x>=0}\right. \)
D) h(x)=\frac{1}{2m}\sum_{i=1}^n(\theta_0+\theta_1 x_i-y_i)^2.
ANSWER: A
На автозавод поступили двигатели от трех моторных заводов. От первого завода поступило 10 двигателей, от второго – 6, от третьего – 4. Вероятности безотказной работы этих двигателей в течении гарантийного срока соответственно равны 0,9; 0,8; 0,7. Какова вероятность того, что установленный на машине двигатель будет работать без дефектов в течении гарантийного срока?
A) 0,83
B) 0,78
C) 0,87
D) 0,56
ANSWER: A
Набирая номер телефона, абонент забыл последние 3 цифры, и, помня лишь, что эти цифры различны, набрал их наугад. Найти вероятность того, что номер телефона набран правильно.
A) \( \frac{1}{720} \)
B) \( \frac{1}{3} \)
C) \( \frac{1}{9} \)
D) \( \frac{3}{10} \)
ANSWER: A
Найти дисперсию случайной величины, заданной функцией распределения\( F(x)=\left\{\begin{matrix} 0, \ x \leq -2, \\ 0,25 x+0,5, \ -2< x\leq 2,\\ 1, \ x > 2. \end{matrix} \right. \)
A) 4/3
B) 5/7
C) 2
D) 1/5
ANSWER: A
Паром для перевозки автомашин через залив подходит к причалу через каждые два часа. Считая, что Х – время ожидания автобуса – распределена равномерно, определить дисперсию времени ожидания прихода парома.
A) 0,333
B) 1
C) 0,5
D) 2
ANSWER: A
Случайная величина Х задана функцией распределения \( F(x)=\left\{\begin{matrix} 0, \ x \leq 2, \\ 0,5 x-1, \ 2< x\leq 4,\\ 1, \ x > 4. \end{matrix} \right. \)Найти вероятность того, что в результате испытания Х примет значение, меньшее трех.
A) 0,5
B) 0,3
C) 0,4
D) 0,1
ANSWER: A
Случайная величина Х задана функцией распределения \leq>\( F(x)=\left\{ \begin{matrix} 0, x \leq -1,\\ \frac{3}{4} x +\frac{3}{4} , -1< x \leq \frac{1}{3},\\ 1, x > \frac{1}{3}. \\ \end{matrix} \right. \)Найти вероятность того, что в результате испытания величина Х примет значение, заключенное в \( \left(0, \frac{1}{3}\right) \)
A) 0,25
B) 0,333
C) 0,75
D) -0,5
ANSWER: A
Случайная величина Х распределена нормально с математическим ожиданием 10. Вероятность попадания в интервал (10,20) равна 0,3. Чему равна вероятность попадания Х в (0,10)?
A) 0,3
B) 0,1
C) 0,5
D) 0,2
ANSWER: A
Случайной величиной является количество выпадения герба при 2 бросаниях монеты. Найти математическое ожидание этой случайной величины.
A) 1
B) 2
C) 0
D) 1/2
ANSWER: A
 Функция распределения непрерывной случайной величины задана выражением: \( F(x)=\left\{\begin{matrix} 1-e^{-x}, x \geq 0,\\ 0, \ \ x<0. \end{matrix}\right. \)Найти вероятность того, что случайная величина примет значение в интервале от 0 до 1.
A) \( 1-\frac{1}{e} \)
B) 3-e
C) 1,2
D) 0,34
ANSWER: A
Как выглядит выход h(x) модели линейной регрессии?
A) \( h(x)=\theta_0+\theta_1 x \)
B) \( h(x)=sigmoid(\theta_0+\theta_1 x) \)
C) \( h(x)=\frac{1}{2m}\sum_{i=1}^n(\theta_0+\theta_1 x_i-y_i)^2 \)
D) \( h(x)= \binom {1, \ \ x \geq 0} {-1,\ x<0} \)
ANSWER: A
Какой метод оптимизации используется для минимизации целевой функции в задаче линейной регрессии?
A) метод градиентного спуска
B) метод ближайших соседей
C) метод опорных векторов
D) метод главных комопонент
ANSWER: A
На графиках представлена зависимость значений целевой функции от числа эпох обучения. Какой график из представленных на рисунке соответствует случаю успешного обучения модели линейной регрессии?[целевая функция - число эпох]
A) ни один
B) верхний
C) нижний
D) оба
ANSWER: A
От скольких переменных зависит целевая функция в задаче одномерной линейной регрессии?
A) 2
B) 1
C) n, где n - число обучающих элементов
D) n+1, где n - число обучающих элементов
ANSWER: A
При решении задачи линейной регрессии методом градиентного спуска, мы
A) минимизируем целевую функцию
B) минимизируем функцию \( h(x)=\theta_0+\theta_1x \)
C) увеличиваем вероятность застрять в локальном минимуме
ANSWER: A
Решается задача линейной регрессии. Ищется зависимость цены дома от его площади и числа комнат. Составлена целевая функция MSE, минимум который мы собираемся искать. От скольких переменных она зависит?
A) 3
B) 2
C) 1
D) n, где n - число образцов в обучающей выборке
ANSWER: A
Сколько неизвестных параметров \( \theta \) ищется методом градиентного спуска в задаче множественной линейной регрессии с \( n \) входными признаками?
A) \( n+1 \)
B) \( n \)
C) \( n-1 \)
D) 2
ANSWER: A
Алгоритм логистической регрессии
A) может быть адаптирован для случая множественной классификации
B) решает только задачу бинарной классификации
ANSWER: A
В модели логистической регресии выход \( h(x) \) есть
A) \( h(x)=sigmoid(\theta^TX) \)
B) \( h(x)=\theta^TX \)
C) \( h(x)=\pm 1 \)
D) \( h(x)=\theta_0+\theta_1x \)
ANSWER: A
Выход модели логистической регрессии имеет вид \( h(x)=sigmoid(\theta^T X) \). Какое из следующих уравнений определяет так называемую "границу решений"?
A) \( \theta^T X =0 \)
B) \( sigmoid(\theta^T X) = 0 \)
C) \( sigmoid(\theta^T X) > 0 \)
D) \( sigmoid(\theta^T X) = 1 \)
ANSWER: A
Как выглядит выход h(x) модели логистической регрессии?
A) \( h(x)=\theta_0+\theta_1 x \)
B) \( h(x)=sigmoid(\theta_0+\theta_1 x) \)
C) \( h(x)=\frac{1}{2m}\sum_{i=1}^n(\theta_0+\theta_1 x_i-y_i)^2 \)
D) \( h(x)= \binom {1, \ \ x \geq 0} {-1,\ x<0} \)
ANSWER: B
Какой из нижеприведенных приемов НЕ является способом борьбы с переобучением?
A) нормализация признаков
B) понижение порядка модели
C) уменьшение числа признаков
D) регуляризация
ANSWER: A
Модель логистической регрессии решает задачу
A) бинарной классификации
B) линейной регрессии
C) множественной линейной регресии
D) нахождения ближайших соседей
ANSWER: A
Решается задача классификации ирисов Фишера. Какой из нижеприведенных методов НЕ подходит для ее решения?
A) линейная регрессия
B) логистическая регрессия
C) метод ближайших соседей
D) взвешенный метод ближайших соседей
E) деревья решения
F) градиентный бустинг
G) метод опорных векторов
ANSWER: A
Что из ниже перечисленных моделей более подвержена явлению переобучения?
A) линейная регрессия
B) гребневая регрессия
C) лассо
D) ElasticNet
ANSWER: A
Чему равно оптимальное число ближайших соседей в методе kNN?
A) подбирается экспериментально в каждой задаче
B) равно числу признаков n
C) равно n+1, где n - число признаков
D) равно 10
E) равно 1
ANSWER: A
Какое из значений k в методе ближайших соседей дает модель более склонную к переобучению?
A) 1
B) 10
C) 100
ANSWER: A
Увеличение числа соседей в методе kNN приводит к
A) сглаживанию границы принятия решений
B) переобучению модели
C) к более точной модели
ANSWER: A
Что из нижеперечисленного является функцией потерь в методе kNN?
A) нет функции потерь
B) логлосс
C) MSE
D) RMSE
E) hinge
ANSWER: A
Что не является параметром метода kNN?
A) шаг обучения
B) число соседей
C) функция расстояния
D) веса соседей
ANSWER: A
Kernel trick или введение новых признаков F вместо исходных признаков X каждого объекта нужно
A) для создания нелинейного классификатора SVM
B) для ускорения сходимости SVM
C) для максимизации зазора
D) для решения задачи регрессии с помощью SVM
ANSWER: A
Большое значение параметра С в методе опорных векторов приводит к тому, что
A) модель склонна к переобучению и ловит выбросы
B) модель имеет более широкий зазор
C) модель склонна к недообучению
D) более гладкой границе решений
ANSWER: A
Какое из следующих равенств определяет границу решений двух линейно неразделимых классов в методе SVM? Здесь F - новые признаки, подсчитанные с применением функции близости (например, Гауссова ядра).\( 1) \ \theta^T X =0 \\ 2)\ \theta^T F =0 \\ 3) \ \theta ^T X = \pm 1 \\ 4)\ \theta^T F= \pm 1 \)
A) 2
B) 1
C) 3
D) 4
ANSWER: A
При использовании метода SVM
A) решается задача выпуклой оптимизации и мы всегда находим глобальный минимум
B) мы можем застрясть в локальном минимуме
C) нужно всегда использовать kernel trick и вводить новые признаки
ANSWER: A
Для чего в первоначальную версию метода t-SNE (SNE) было добавлено t-распределение Стьюдента?
A) для решения проблемы скученности
B) для обобщения метода на случай линейно неразделимых классов
C) для автоматического определения числа главных компонент
D) для уменьшения переобучения
ANSWER: A
Можно ли использовать метод PCA с числом главных компонент равным числу признаков?
A) да, при этом уберем корреляцию между признаками
B) да, но при этом входные данные не будут никак преобразованы
C) нет, в этом случае матрица сингулярного разложения будет вырождена
D) нет, в этом случае алгоритм разойдется
ANSWER: A
Укажите отличие методов PCA и t-SNE
A) PCA направлен на сохранение глобальной, а t-SNE - локальной структуры данных
B) в методе PCA есть целевая функция, а в t-SNE ее нет
C) метод PCA не пригоден для визуалиации данных в отличие от t-SNE
D) метод PCA итерационный, а t-SNE нет
ANSWER: A
Укажите смысл параметра перплексити метода t-SNE
A) число близких соседей
B) число главных компонент
C) пороговое значение дисперсии
D) шаг обучения
ANSWER: A
Что понимается под проблемой скученности?
A) невозможность сохранить все расстояния между соседями при отображении в пространство меньшей размерности
B) большой объем выборки и, как следствие, много похожих элементов
C) вырожденность сингулярной матрицы при применении PCA к выборкам большой размерности
ANSWER: A
В какой из этих моделей увеличение числа деревьев дает, как правило, лучший эффект?
A) случайный лес
B) градиентный бустинг
ANSWER: A
Какая из следующих моделей машинного обучения не является ансамблевой моделью?
A) взвешенный kNN
B) случайный лес
C) градиентный бустинг
D) бэггинг
ANSWER: A
Какой из следующих методов наименее чувствителен к отсутствию предварительной нормализации признаков?
A) деревья решений
B) метод линейной регрессии
C) метод логистической регрессии
D) метод ближайших соседей
ANSWER: A
При построении ансамбля методом градиентного бустинга образцы, которые доставляют большую ошибку первой обученной модели
A) имеют больший шанс попасть в выборку для обучения второй модели
B) исключаются из обучающей выборки для последующих моделей
C) ничем не отличаются от остальных и могут также случайно быть выбраны
ANSWER: A
Если все листья обученного дерева являются чистыми, то...
A) дерево имеет 100%-ную правильность на обучающей выборке
B) это означает, что деревья решений не подходят для данной задачи
C) это означает, что все дочерние листья содержат по одному элементу
D) дерево имеет 100%-ную правильность на проверочной выборке
ANSWER: A
Как называется метод тестирования точности модели, при котором все имеющиеся данные делятся на два подмножества, на одном из которых модель обучается, на другом тестируется.
A) held-out/hold-out set
B) K-fold-cross-validation
C) Leave-one-out cross validation
D) MinMaxScaler
ANSWER: A
Какой из следующих способов контроля качества обучения будет самым затратным в вычислительном плане?
A) Leave-one-out cross validation
B) K-fold cross validation
C) held out/hold out set
ANSWER: A
Кросс валидация используется для
A) оценки точности модели
B) нормализации входных данных
C) выбора оптимального разбиения на тестовый и обучающий наборы данных
ANSWER: A
Решетчатый поиск используется для
A) перебора возможных значений параметров
B) оценки точности модели
C) нормализации данных
ANSWER: A
Тестовые данные нормализуются по формуле:\( x=\frac{x-x_{min}}{x_{max}-x_{min}} \)Здесь \( x_{min}, x_{max} \) находятся по
A) данным обучающей выборки
B) данным тестовой выборки
C) данным и тестовой и обучающей выборки вместе
ANSWER: A
[l]что здесь показано?
A) зависимость точности модели на обучающей и валидационной выборках от размера обучающей выборки
B) оценки полученные по методу кросс валидации для двух случаев разбиения выборки
C) процесс сходимости итерационного алгоритма к одной точке
ANSWER: A
